Evolution de schéma par classification automatique pour les entrepôts de données

نویسندگان

  • Ony Rakotoarivelo
  • Fadila Bentayeb
چکیده

Résumé. Les modèles et outils OLAP actuels gèrent les dimensions d’analyse d’un entrepôt de données de manière statique. Par conséquent, les axes d’analyse restent souvent figés malgré l’évolution des besoins et des données. Dans cet article, nous proposons une approche d’évolution de schéma basée sur une technique de classification automatique. Pour cela, nous cherchons le meilleur regroupement des instances d’un niveau d’analyse choisi par l’utilisateur en utilisant la méthode des k-means. Un nouvel axe d’analyse est ensuite construit à partir du résultat de cette classification. Pour choisir les descripteurs du niveau d’analyse à classifier, nous proposons deux solutions: la première utilise directement les attributs décrivant le niveau à classifier. Par contre, la deuxième solution décrit le niveau d’analyse par les mesures dans la table des faits. Pour valider notre approche, nous l’avons intégrée et testée à l’intérieur du SGBD (Système de Gestion de Bases de Données) Oracle 10g.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Évolution de schémas dans les entrepôts de données : modèle à base de règles

La mise en œuvre d’un entrepôt de données nécessite un important travail d’étude de l’existant et de recueil de données pour bien traiter les besoins d’analyses. Hors, il est impossible de définir de façon exhaustive ces besoins pour l’ensemble des utilisateurs. La prise en compte de nouveaux besoins d’analyses nécessite l’évolution du schéma de l’entrepôt de données. Deux alternatives existent...

متن کامل

Mining Frequent Queries in Star Schemes

Résumé. L’extraction de toutes les requêtes fréquentes dans une base de données relationnelle est un problème difficile, même si l’on ne considère que des requêtes conjonctives. Nous montrons que ce problème devient possible dans le cas suivant : le schéma de la base est un schéma en étoile, et les données satisfont un ensemble de dépendances fonctionnelles et de contraintes référentielles. De ...

متن کامل

Intégration de données environnementales : une approche basée sur les entrepôts de documents XML et les ontologies

Résumé. Cet article présente l’approche que nous avons adoptée pour résoudre le problème d’intégration de données dans le contexte du projet SIC-Sénégal dont l‘objectif est de permettre à plusieurs organismes partenaires de partager leurs sources de données environnementales. Nous réalisons une intégration en deux phases. Une première phase d’intégration structurelle, basée sur l’utilisation d’...

متن کامل

Evolution de modèle dans les entrepôts de données : existant et perspectives

Résumé. Un entrepôt de données permet d’intégrer des sources de données hétérogènes à des fins d’analyse. Un des points clés de la réussite du processus d’entreposage de données réside dans la définition du modèle de l’entrepôt en fonction des sources de données et des besoins d’analyse. Une fois l’entrepôt conçu, le contenu et la structure des sources de données, tout comme les besoins d’analy...

متن کامل

Une représentation des arborescences pour la recherche de sous-structures fréquentes

Résumé. La recherche de structures fréquentes au sein de données arborescentes est une problématique actuellement très active qui trouve de nombreux intérêts dans le contexte de la fouille de données comme, par exemple, la construction automatique d’un schéma médiateur à partir de schémas XML. Dans ce contexte, de nombreuses propositions ont été réalisées mais les méthodes de représentation des...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007